iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 2
1
AI & Data

飛哥與小博的30天-統計與機器學習成長日記系列 第 2

[DAY 2] 章節1-2: 意外的雞胸肉-標準差與變異數(Python)

  • 分享至 

  • xImage
  •  

人物介紹: 小博

說到飛哥與小博的關係,小博是飛哥的工作助理,大學才剛畢業沒多久,卻因一次在台大羽球館打球休息時遇到飛哥,聽到飛哥在與電話另一頭的人說什麼迴歸分析啊、時間序列、決策樹等等的專有名詞,雖然聽不太懂,倒也聽得津津有味。飛哥這時掛了電話突然轉頭過來問說:「看你這麼有興趣,要來我的工作室見習下嗎? 我剛好缺個助手。」,小博心想不如趁現在還沒找到工作的空檔,先去看看吧,於是靦腆地答應了飛哥的邀約。

1-2 意外的雞胸肉

天色漸暗,飛哥被一抹大鍋翻炒後的蒜酥香味叫醒,看到小博將金黃的蒜酥撒在舒肥後的雞胸上,再加點玫瑰鹽,一道簡單的料理就完成了。

「想不到你廚藝還不錯嘛!」小飛有些開心的說著。

「還好啦!平常在外面住也是自己弄吃的,稍微會兩手也很正常啊---。」第一次被誇獎的小博顯得有點雀躍。

兩人吃著吃著,小博問說:「你下午說了『平均數』、『中位數』的差異,我上網查了一下,好像『變異數(Variance)』跟『標準差(Standard Deviation)』也可以用來補足平均數所缺少的資訊ㄟ,但這兩個好難分喔……」

「來! 跟我說一遍平方差」飛哥說道。「平方差!」小博答。

「不對,說『一變平方差』」飛哥再次說道。「喔喔! 『一變平方差』!」小博答。

「意思就是『一個變異數等於平方後的標準差』,這樣比較好記吧!」頓了一下續說,「基本上這兩個都拿來當作測量資料分散程度的指標,資料愈分散的話,這兩個指標就會愈大,只是差在有沒有開根號而以,當然這兩種指標通常為了計算方便,而常常互相轉換,像我們常看到的Var(x)就代表變數x的變異數,而標準差比較常用在信賴區間這個地方。」隨後飛哥嚼了一口鮮嫩多汁的舒肥雞胸肉,細細品嘗著。

小博想了一下說:「所以台積電那五人薪水的變異數會比安麗那五人薪水的變異數小很多囉?」

吞下雞肉後,飛哥繼續說著:「對啊,所以當一家公司宣稱它薪水很高時,要看是不是每個員工都拿這樣的錢,而不是只有少數的人拿走大部分的錢。」

「對了,我後天要去日本出差,去見一個社長,他是之前跟我合作過的客戶,你也一起來吧!」飛哥拿起桌上的紙巾滿足地擦了擦嘴。

小博驚訝地說不出話來,心想「嗯?!這麼快就遇上人生第一次的出差了。」


Python程式時間:

import numpy as np
a=[30000,30000,40000,50000,50000]
b=[1000,1000,1000,1000,196000]
print('Variance of a is ',np.var(a),'.\nVariance of b is ',np.var(b),'.')
#Variance of a is  80000000.0 .
#Variance of b is  6084000000.0 .

print('S.D. of a is ',np.round(np.sqrt(np.var(a)),2),'.\nS.D. of b is ',np.sqrt(np.var(b)),'.')
#S.D. of a is  8944.27 .
#S.D. of b is  78000.0 .

# np.round(x,2) 將x四捨五入到小數第二位
# np.sqrt(x) 將x開根號

後記: 飛哥的工作室是附有廚房的,小博下班後偶而會在這邊練練廚藝,雖然只是來見習的,實際上工作就是整理資料、偶爾打掃下房間,雖然兩人都會打羽球,但實際上完全沒有一起打過。

資料參考:
https://smallcollation.blogspot.com/2013/08/variance-and-standard-deviation.html#gsc.tab=0


上一篇
[DAY 1] 章節1-1: 像風一樣的男人-初見平均數與中位數(Python)
下一篇
[DAY 3] 章節1-3: 電池大亨的煩惱-盒鬚圖與四分位數(Python)
系列文
飛哥與小博的30天-統計與機器學習成長日記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言